Материалы по тегу: big data
19.09.2023 [00:13], Владимир Мироненко
NeuroBlade интегрирует SQL-ускорители SPU с VeloxСтартап NeuroBlade, специализирующийся на разработке решений для ускорения анализа данных, объявил о сотрудничестве с сообществом Velox компании Meta✴ Platforms с целью интеграции ускорителя SQL Processing Unit (SPU) в новый унифицированный фреймворк для работы с данными. Как отметили в NeuroBlade, полная интеграция SPU NeuroBlade в Velox обеспечивает ускорение обработки данных более чем в 10 раз, помимо трёхкратного повышения производительности, уже достигнутого Velox за счет оптимизации ПО. Цель проекта заключается в том, чтобы дать компаниям возможность эффективно обрабатывать огромные наборы данных, говорится в пресс-релизе. ![]() Источник изображения: NeuroBlade Элад Сити (Elad Sity), гендиректор и соучредитель NeuroBlade, подчеркнул важность совместных усилий, которые «знаменуют эпоху, когда организации смогут умело управлять растущими объёмами данных, повышать производительность аналитики и получать значительные конкурентные преимущества». Velox представляет собой унифицированный open source движок, который объединяет различные программные оптимизации в области обработки запросов в единую высокопроизводительную библиотеку, а в будущем и в самостоятельный фреймворк. Velox уже совместим с Presto и Apache Spark. Интеграция SPU NeuroBlade в Velox достигается за счёт новых API Velox, которые позволят произвольно переносить выполнение части запросов на ускоритель. Как отмечается в пресс-релизе, CPU с трудом справляются с аналитическими запросами, скорость которых превышает 2–3 Гбайт/с, из-за ограничений в обработке данных и сложности запросов. SPU NeuroBlade позволяет решить эту проблему, поскольку предлагает специализированный процессор, который обеспечивает аппаратную обработку сложных запросов и работу с памятью и хранилищем, что позволяет разгрузить CPU и добиться постоянной пропускной способности при обработке больших данных и снизить задержки.
16.09.2023 [21:34], Сергей Карасёв
Стартап Databricks привлёк ещё $500 млн, что повысило капитализацию компании до $43 млрдСтартап Databricks, разработчик платформы машинного обучения, анализа и обработки данных, сообщил о проведении раунда финансирования Series I: на развитие привлечено дополнительно $500 млн. Таким образом, на сегодняшний день общий объём инвестиций в эту компанию превысил $4 млрд. Databricks предоставляет озеро данных, которое предприятия могут использовать для хранения, организации и анализа больших объемов информации. Стартап также помогает заказчикам в развёртывании собственных приложений на базе генеративного ИИ. Компания основана в 2013 году создателями Apache Spark. ![]() Источник изображения: Gabby Jones / Bloomberg Отмечается, что Databricks быстро наращивает выручку: по итогам II четверти текущего финансового года, которая была закрыта 31 июля, показатель преодолел знаковый рубеж в $1,5 млрд — это более чем на 50 % превосходит прошлогодний результат. В глобальном масштабе решения Databricks применяют свыше 10 тыс. организаций, включая более половину компаний из списка Fortune 500. Раунд финансирования Series I проведён под руководством T. Rowe Price Associates. В программе также приняли участие Andreessen Horowitz, Baillie Gifford, ClearBridge Investments, Counterpoint Global (Morgan Stanley), Fidelity Management & Research Company, Franklin Templeton, GIC, Octahedron Capital, Tiger Global, Capital One Ventures, Ontario Teachers' Pension Plan и NVIDIA. Прошлый раунд финансирования Databricks был завершён в 2021 году: тогда стартап получил $1,6 млрд, а его рыночная стоимость достигла $38 млрд. Теперь же капитализация оценивается в $43 млрд при стоимости акций на уровне $73,5.
14.07.2023 [18:44], Руслан Авдеев
Минцифры России подготовит национальный проект «Экономика данных»
big data
hardware
ии
интернет
информационная безопасность
квантовые вычисления
минцифры россии
россия
цифровизация
Минцифры сообщило о скором начале реализации очередного национального проекта «Экономика данных». Как сообщает пресс-служба министерства, проект подготовят до конца текущего года. При этом реализация нового проекта будет продолжаться до 2030 года. Целью проекта станет перевод всей экономики, социальной сферы и органов власти на новый уровень. Это касается решений в области логистики, телемедицины, онлайн-образования и предоставления госуслуг. Как сообщает «Интерфакс», речь идёт не только о консолидации уже существующих инструментов, применяемых для развития систем ИИ, квантовых технологий и цифровой экономики в целом — необходимо выстроить целостный механизм создания и внедрения новых разработок. Как уточняется, фокус следует сделать на ряде направлений:
Как сообщают в Минцифры, новый национальный проект в конечном счёте направлен на повышение качества жизни граждан за счёт роста качества работы властей, роста экономики и развития социальной сферы. Какие средства будут выделены на реализацию проекта и какие именно направления будут развиваться особенно активно, будет объявлено позже.
19.04.2023 [15:35], Татьяна Золотова
АБД: рынок Big Data в России вырастет до 319 млрд руб. к концу 2024 года, но его развитие будет зависеть от действий государстваРынок больших данных в России при базовом сценарии развития вырастет до 319 млрд руб. к концу 2024 года, полагают в Ассоциации участников рынка больших данных (АБД, объединяет «Яндекс», VK, «Ростелеком», «Мегафон» и др.). АБД разработала стратегию развития ИТ-рынка, описывающую пять различных сценариев. Об этом сообщает «Коммерсантъ». Наилучший сценарий (рост рынка до 441 млрд руб.) предполагает появление страхования от утечек персональных данных для защиты их субъектов. Целевой подразумевает рост рынка со 170 млрд руб. в 2021 году до 319 млрд руб. в 2024 году. В этом случае рынок должен быть «приоритетным для государства», а услуги и решения в области Big Data — распространяться на другие сегменты, где нужно стимулировать спрос и заниматься импортозамещением ПО. Если же, пишет «Коммерсантъ», государство будет вести политику «мобилизационной экономики» в области Big Data (монополизация и возложение госзаданий на крупные компании), то граждане будут готовы делиться минимумом информации. При таком сценарии рынок больших данных в России составит всего 189 млрд руб. к концу 2024 года. Стратегия обсуждается с администрацией президента, Минцифры, Минэкономики, Минпромторгом, Госдумой и Советом федерации. В Минцифры «Коммерсанту» сообщили, что представили АБД договорились с бизнесом о разработке совместного проекта по подготовке ИТ-аналитики, чтобы заполнить нишу отраслевой аналитики, которая образовалась после ухода с рынка ряда западных агентств.
03.04.2023 [21:51], Татьяна Золотова
За кредитование Сбера ответит собственная графовая платформаСбер разработал графовую платформу для работы с большими данными и встроил ее в бизнес-процессы корпоративного и розничного кредитования. В компании уверяют, что это позволит эффективнее принимать решения о выдаче кредитов и их параметрах. Платформа состоит из восьми сервисов. «Лаборатория графов» — это интерактивный инструмент для исследования графов и разработки новых графовых моделей (ML), который позволяет пользователям загружать свои данные и строить собственные витрины. Сервис «Графовые расчеты» помогает выполнять массовые регулярные расчеты на больших графах для исполнения графовых моделей. «Единый граф клиентских связей» (ЕГКС) объединяет актуальные витрины данных о полной связанности между собой всех клиентов банка. Еще один сервис — «Онлайн-доступ к графу» — работает в режиме «вопрос – ответ». Например, он поможет выяснить, есть ли признаки фрода (мошеннических операций) в окружении клиента. «Визуализация графов» отвечает за доступ к интерактивному просмотру графов и выявляет скрытые взаимосвязи между компаниями и физлицами, а сервис поиск неявных связей Link Prediction — за неизвестные факты о связанности клиентов, если данные о них изначально отсутствовали или были скрыты. Среди сервисов также есть «Графовые нейронные сети» (GNN) — это готовый пайплайн обучения Graph Convolutional Network на базе PyTorch Geometric по собственным таргетам. «Встраиваемая графовая база данных» подходит для нестандартных решений. В ядре платформы Сбера находится собственная производительная база данных FastGraph, а также open-source-технологии стека Hadoop. Как отмечают в компании, уже собрано более 17 Пбайт плотно связанной между собой неоднородной обезличенной информации. Сервисы платформы применяются в десятках автоматизированных бизнес-процессов Сбера. BI-инструментами и данными платформы пользуется 6,5 тыс. специалистов компании.
24.03.2023 [23:08], Андрей Крупин
R-Style Softlab представила импортозамещённую платформу для работы с даннымиВходящая в группу «Россельхозбанка» компания R-Style Softlab сообщила о выпуске на российский рынок нового продукта R-Style Intelligent System (RSIS), предназначенного для работы с данными и организации долгосрочного их хранения средствами СУБД ArenaDataDB, GreenPlum, PostgreSQL. RSIS позволяет собирать и аккумулировать данные из различных источников, обрабатывать их и визуализировать полученные результаты, что способствует принятию эффективных управленческих решений. В основу платформы положена датацентричная реализация с применением методологии Data Vault («Свод данных»). По заверениям разработчика, такой подход обеспечивает высокую скорость загрузки и обработки данных. ![]() Источник изображения: our-team / freepik.com В числе прочих особенностей R-Style Intelligent System называются совместимость программного комплекса с отечественными решениями класса Business Intelligence (BI), поддержка потоковой и пакетной загрузки данных, в том числе механизмов взаимодействия с пакетом Apache Hadoop, возможность интеграции с партнёрскими решениями на базе искусственного интеллекта. Для обеспечения актуальности и качества данных возможно применение методологии Data Governance. «Мы придерживаемся комплексного подхода к автоматизации работы с данными. Наш продукт совместим с отечественными BI-инструментами. Благодаря применению готовых решений партнёров, система может дополняться функциями для управления потоками данных, обеспечения мобильности, построения моделей данных, применения AI-технологий и т. д. По требованию заказчика мы можем также предоставить оборудование и системное ПО», — отмечает компания-разработчик платформы RSIS.
20.03.2023 [15:22], Андрей Крупин
«Яндекс» открыл исходный код платформы для работы с большими данными YTsaurusКоманда разработчиков «Яндекса» опубликовала исходный код масштабируемой платформы распределённого хранения и обработки больших данных YTsaurus. YTsaurus разрабатывается компанией с 2010 года и является одним из ключевых элементов внутренней IT-инфраструктуры «Яндекса». В основу платформы положен набор связных подсистем: MapReduce, движок SQL-запросов, планировщик, KV-хранилище данных для OLTP. YTsaurus поддерживает работу с десятками тысяч серверов, обработку эксабайтов данных на разных носителях, а также интеграцию с ClickHouse и Apache Spark. Благодаря широкой функциональности платформа может быть использована для широкого круга задач — от аналитики и построения хранилищ данных до обучения сложных ИИ-моделей с миллиардами параметров. ![]() Сценарии использования YTsaurus «Платформа YTsaurus отлично зарекомендовала себя в «Яндексе». Теперь мы сделали её доступной и за его пределами. Наибольшую пользу YTsaurus может принести крупным компаниям, которые обрабатывают гигантские объёмы данных на тысячах серверов в условиях постоянно возрастающей нагрузки. Мы уверены, что публикация кода выведет платформу на новый виток развития, как это уже было с другими нашими продуктами», — отмечает «Яндекс». Исходный код и документация YTsaurus доступны на площадке GitHub. Код распространяется под лицензией Apache 2.0. Использовать платформу или доработать её под себя может любой желающий.
15.03.2023 [16:27], Татьяна Золотова
В Минцифры создан департамент больших данных и искусственного интеллектаНовый департамент больших данных и искусственного интеллекта возглавил Сергей Сергиенко, до этого работавший советником министра. Курирует структуру профильный заместитель министра цифрового развития Григорий Борисенко. Григорий Борисенко рассказал TAdviser, что профильные направления департамента отвечают за такие вопросы, как создание разных продуктов внутри ведомства с использованием данных, например, «фабрики данных», цифровые профили. Также в зону ответственности входят создание инфраструктуры для предоставления датасетов для обучения ИИ, анализ и работа над устранением нормативных и процессных барьеров, связанных с развитием и внедрением ИИ в госуправлении и в различных отраслях. Департамент отвечает, в том числе, за национальную систему управления данными (НСУД), за систему межведомственного электронного взаимодействия (СМЭВ) и различные аспекты перевода госуправления на цифровую основу. Ранее ответственность за них была распределена по разным департаментам. Департамент больших данных и искусственного интеллекта, 19-й по счету, был сформирован в конце 2022 года. |
|